arXiv:1907.09278v2 [cs.AI] 2021 年 3 月 1 日
机构名称:
¥ 8.0

在复杂环境中做出决策是人工智能 (AI) 面临的一个关键挑战。涉及多名决策者的情况尤其复杂,导致原则性解决方法在计算上难以解决。人工智能领域的大量研究试图通过提炼交互的本质来缓解这一问题:一个代理的策略如何影响另一个代理?如果我们能够找到这种影响的更紧凑表示,这可以帮助我们处理复杂性,例如通过搜索影响空间而不是策略空间。然而,到目前为止,这些影响概念的适用性仅限于特殊的交互情况。在本文中,我们形式化了基于影响的抽象 (IBA),它有助于消除潜在状态因素而不会造成任何价值损失,适用于一类非常普遍的问题,即分解部分可观随机博弈 (fPOSG)。一方面,这概括了现有的影响力描述,因此可以作为改进可扩展性和其他复杂多智能体决策见解的基础。另一方面,由于其他智能体的存在可以看作是单个智能体设置的概括,我们对 IBA 的公式也为单个智能体在抽象下的决策提供了足够的统计数据。我们还详细讨论了与这些先前研究的关系,确定了这些方法的新见解和解释。通过这些方式,本文加深了我们对广泛的顺序决策设置中的抽象的理解,为一大类问题的新方法和算法提供了基础。

arXiv:1907.09278v2 [cs.AI] 2021 年 3 月 1 日

arXiv:1907.09278v2 [cs.AI] 2021 年 3 月 1 日PDF文件第1页

arXiv:1907.09278v2 [cs.AI] 2021 年 3 月 1 日PDF文件第2页

arXiv:1907.09278v2 [cs.AI] 2021 年 3 月 1 日PDF文件第3页

arXiv:1907.09278v2 [cs.AI] 2021 年 3 月 1 日PDF文件第4页

arXiv:1907.09278v2 [cs.AI] 2021 年 3 月 1 日PDF文件第5页

相关文件推荐

我的 2021 年
2021 年
¥1.0
2021
1900 年
¥6.0
2021
2021 年
¥11.0
2021 年年度报告
2022 年
¥6.0